コンピュータビジョンとは? 画像を処理して理解する身近な技術の概要と応用
コンピュータの画像処理技術は進化し続けています。
近年では機械学習も組み合わされ、様々な用途で使用されています。
画像処理に関する数々の研究分野のなかで注目を浴びている分野のひとつが、「コンピュータビジョン」です。
わかりやすいところではドラマや映画の映像効果、身近なところではインターネットの画像検索やデジタルカメラの顔認識機能などで使われています。
この記事では、コンピュータビジョンについて解説します。
Contents [hide]
コンピュータビジョンとは
コンピュータビジョン(Computer Vision)とは、「コンピュータをもちいた視覚の実現」を研究する学術分野です。
世界中の情報工学系の優秀な研究者が競い合って研究を進めています。
コンピュータビジョンの研究目的
コンピュータビジョンの目的は、コンピュータに人間の目に相当する機能を持たせること、つまり、「コンピュータによる視覚」を実現することです。
具体的には静止画もしくは動画のデータをもとに、コンピュータのソフトウェアが人間の視覚に近い、もしくはそれ以上の機能を持つことを目標としています。
たとえば、カメラからの入力画像をコンピュータで処理し、ロボットや自動運転車の目として機能させることなどが挙げられます。
コンピュータグラフィックスとの違いは?
コンピュータでの画像処理技術といえば、今まではコンピュータグラフィックス(略称:CG)が主流でした。
コンピュータグラフィックスとコンピュータビジョンの違いは以下の通りです。
■ コンピュータグラフィックス
3次元の立体を2次元のディスプレイへ投影表示するための技術
■ コンピュータビジョン
現実世界を撮影した2次元の画像データから、3次元の情報を導き出す技術
コンピュータグラフィックスとコンピュータビジョンは対照的な技術ですが、それゆえ補完し合ってあらたな技術に貢献することもあります。
バーチャルリアリティ(VR)や拡張現実感(AR)などの画像表示技術はその一例です。
大学の研究室でもパターン認識・機械学習の研究が進められている
筑波大学のシステム情報工学研究科には、コンピュータビジョン研究室(CVLAB)があります。
この研究室は人工知能科学センターに属しており、ヒューマンセンシングやバイオインフォマティクス、ロボット視覚の研究、パターン認識・機械学習の理論研究をおこなっています。
この研究室の飯塚先生は凸版印刷との共同研究として、モネの絵画「睡蓮、柳の反映」のデジタル修復に協力しました。
このプロジェクトで飯塚先生は、モネのほかの作品をもとにAIに彩色パターンを学習させ、「睡蓮、柳の反映」の色彩の一部も参考に全体の色を推定させました。
ソフトバンクがコンピュータビジョンに特化した企業を設立
ソフトバンク株式会社は2019年5月、世界最高水準のAI技術を持つ香港のセンスタイム社をパートナーに、画像認識ソリューションの開発・提供をおこなう「日本コンピュータビジョン株式会社」を子会社として設立しました。
センスタイム社は、ディープラーニングとコンピュータビジョン技術を使った顔認証技術に定評がある会社です。
顔認証機能のあるアンドロイド端末の7割にはセンスタイム社の技術が使われています。
日本コンピュータビジョン社では、センスタイム社の画像認識技術を活用し、スマートビルディングやスマートリテール分野でのソリューションの提供を予定しています。
具体的には、ビルの入退館管理や店舗・商業施設の受付・案内の効率化といった、セキュリティや利便性を高めるソリューションの開発がひとつ。
さらに、購入検討商品や店内行動を記録し、それをもとにおすすめ商品や割引情報をスマートフォンを通して提示するといったソリューションの実施も検討されています。
パーソルクロステクノロジーでは、エンジニアのスキルアップ・キャリア形成を支援する無料セミナーを定期開催しております。ご興味のある方は下記リンクよりご覧ください。
コンピュータビジョン技術例
ここではコンピュータビジョン技術の具体例を紹介します。
デジタルカメラの顔画像認識
デジタルカメラやスマートフォンなどで使われている顔認識機能は、コンピュータビジョン技術の一例です。
顔認識とは、機械学習をもちいてデータベースに蓄積された輪郭や目・鼻・口の位置などをパターン認識で照合し、対象の画像から人間の顔を見つけ出す技術です。
デジタルカメラに搭載されている、ファインダーを覗くと自動的に人の顔にピントが合う機能や、笑顔になった瞬間にシャッターを切る機能などにこの技術が使われています。
AR(拡張現実感)
ARとは「Augmented Reality」の略で、現実世界の風景に3DCGなどを重ねて表示する技術です。
コンピュータによって情報を追加する、「拡張現実感」を指します。
ARは現実世界を認識するコンピュータビジョンと、架空の世界を描くコンピュータグラフィックスを融合させた一例です。
近年流行したスマートフォン用のゲーム「ポケモンGO」がわかりやすい例でしょう。
AR技術によって、ゲームのキャラクターがまるで現実世界に登場したかのような感覚を味わえます。
その他、AR技術は家具や家電の設置シミュレーションアプリなどにも活用されています。
ウェアラブル端末のように使えるAR搭載のコンタクトレンズといった技術の開発も進行中です。
自動車の自動運転
自動車の自動運転では、搭載されたカメラが目の役割を担います。
カメラが捉えた映像をコンピュータビジョンの技術で解析し、自動運転に役立てるのです。
たとえば、「前方衝突防止システム」の場合、前方に設置したカメラが近くの車や人を検出すると運転手へ警告音を発します。
さらに、危険な距離まで近づくと自動でブレーキがかかり衝突を防ぎます。
ほかにも、運転手が意図せず車線からはみ出してしまった時に警告音で知らせる「車線逸脱警告システム」や、駐車時に前後左右のカメラが撮影した映像を上空からの映像のように合成して表示する「駐車支援システム」などが開発されています。
監視カメラシステム
監視カメラの映像から特定の人物を自動検出するケースにおいても、コンピュータビジョンの技術が活用されています。
一例として挙げられるのが、株式会社ティービーアイの画像解析システム「TB-eye AI Solution」です。
このシステムは、ディープラーニングとコンピュータビジョンの物体認識技術の組み合わせで、高性能な顔認証や画像解析を実現します。
約1万人の顔を登録でき、登録されている人物、もしくは、逆に登録のない人物を検知すると、アラームが鳴るという設定が可能です。
また、「白い車」「黒い服の人物」などの条件を設定すると、AIが映像から対象物を判別する「スマート検索」というシステムも開発されています。
このシステムにより、リサーチ時間を大幅に短縮することが可能です。
ほかにも、人物を特定するという目的で、手のひらや指を端末にかざしておこなう静脈認証でも、コンピュータビジョンの技術が使われています。
医療画像処理
CTやMRIで人体内部を撮影した画像から、画像認識技術で患部を見つける研究も進められています。
また、スイス連邦工科大学ローザンヌ校の研究チームが、生きた細胞の3D画像を数分で作り出せるデバイスを開発しました。
これにより細胞ひとつのレベルで薬剤効果を研究することも可能になりました。
日本国内でもコンピュータビジョンをはじめとするAI技術をもちいた画像診断支援ソフトウェアの開発が進んでおり、医療関係者の関心を集めています。
コンピュータビジョン技術の応用例
ここからはコンピュータビジョン技術の応用例を紹介します。
マッチムーブ
「マッチムーブ」は、映画やドラマでよくもちいられる3DCGの合成技術です。
俳優の演技はブルーシートのスタジオで撮影し、後から合成する背景CGはカメラの視点変化と3次元情報をもとに計算・作成し、俳優の映像とマッチングさせる手法です。
風景の映像に別の動画や3DCGを合成する点ではARと似ていますが、ARがリアルタイムの処理であるのに対し、マッチムーブは映像を後から合成する動画編集技術となります。
プロジェクションマッピング
「プロジェクションマッピング」は、最近様々なイベントで見られるようになった、建物などの立体的なものに映像を投影する技術です。
オフィスや映画館等で使用する普通のプロジェクターの場合は、平面のスクリーンに垂直に映像を投影します。
画面も通常は四角形です。
対してプロジェクションマッピングの場合は、映像を投影する建物の3次元情報を読み取り、その形状に合わせて(マッピングして)投影します。
指定した輪郭の内部にだけ投影すること、さらに、面の変わり目ごとに投影する映像を変えることも可能です。
正面以外から見たときも不自然にならないように調整できます。
このマッピング作業は映像編集ソフトでおこなうのが基本です。
プロジェクターとカメラの間で3次元における位置関係をキャリブレーション(調整)しておけば、3次元空間に高精度で映像をマッピングすることが可能です。
また、この技術はさらに進化し、部屋や通路に投影した映像が、その空間にいる人々の動きに反応して変化するような、インタラクティブなプロジェクションマッピングも生まれています。
ジェスチャー認識
近年では、手を触れずに身振りだけでテレビやカメラを操作するような、ジェスチャー認識技術がユーザインターフェースとして注目されています。
Microsoft社のゲーム機「Xbox360」のコントローラーとして販売された「Kinect」は、この技術を採用した商品です。
カメラやセンサーが搭載されており、何かに触れることなく、ジェスチャーや音声で操作が可能です。
ほかにも、3D形状計測センサが搭載されています。
これらの技術にもコンピュータビジョンの技術が活かされています。
低価格で高性能だったこともあり、世界的なヒット商品となりました。
その後、ゲーム以外の商用アプリケーション制作にも使用できる開発者用パッケージが安価で提供され、様々な分野で応用されるようになりました。
そのひとつ、医療分野では、手術中の医師が非接触ジェスチャー認識によってPC操作ができる、といったシステムが利用されています。
このシステムを使用すれば、手術中にPC画面に手を触れたり、ほかのスタッフにPC操作を指示したりすることなくレントゲン写真を確認できるため、衛生面に配慮したうえで効率化も図れます。
コンピュータビジョンを知るおすすめ本
コンピュータビジョンを理解するうえで役立つ、おすすめの書籍を紹介します。
コンピュータビジョン 最先端ガイド
出典:https://www.amazon.co.jp/コンピュータビジョン最先端ガイド1-CVIMチュートリアルシリーズ-倉爪-亮/dp/4915851346
情報処理学会CVIM研究所が開催したCVIMチュートリアルシリーズの第1回~5回までの講演内容を加筆修正のうえまとめた本です。
サンプルプログラム付きで、コンピュータビジョンのアルゴリズムを理解するのに役立つ一冊です。
CVIMチュートリアルシリーズは、6冊目まで発売されています。
コンピュータビジョン―広がる要素技術と応用―
出典:https://www.amazon.co.jp/コンピュータビジョン-―広がる要素技術と応用―-未来へつなぐ-デジタルシリーズ-37/dp/4320123573
2018年6月に発売された、京都大学の米谷竜博士、慶応義塾大学の斎藤英雄博士らによるコンピュータビジョンに関する著書です。
カメラキャリブレーションなどの基本技術から、顔認識や行動認識など近年の応用技術、ほか、近似最近傍探索や凸最適化といった基盤技術も学べる一冊です。
コンピュータビジョン アルゴリズムと応用
出典:https://www.amazon.co.jp/コンピュータビジョン-―アルゴリズムと応用―-Richard-Szeliski/dp/432012328X
カラー写真や図を多用して実践的に解説した、コンピュータビジョンの教科書的な本です。
800ページを超えるなかで、多視点幾何や画像生成過程などの基礎的なテーマから、映画など特殊視覚効果に取り入れられているコンピュータビジョン技術まで紹介されています。
また、パターン認識や機械学習の例として、デジタルカメラの顔検出機能についても解説されています。
コンピュータビジョンが人間の視覚を助け、視野を広げる
人間が外から取得する情報の8割以上は、視覚からだといわれています。
コンピュータビジョンにより、コンピュータが人間の目やそれ以上の機能を持つことが可能になれば、より便利で安全な生活が実現するでしょう。
コンピュータビジョンの技術は、華やかなエンターテインメントの分野だけではなく、自動車の自動運転やロボットの開発など、近年注目を浴びている次世代技術に不可欠です。
様々な分野の可能性を広げる技術として、今後ますます重要視されることは間違いありません。
視野を広げ、世の中の役に立つ新しい技術の発展に貢献したいエンジニアの方は、ぜひお勧めの本などで知見を広げてみてください。
- コンピュータビジョンの目的は、コンピュータで「人間に近い視覚」を実現すること
- コンピュータグラフィックスとは似ているが対照的な技術
- コンピュータビジョン技術はエンターテインメントだけでなく、医療や車の自動運転などにも活用される